پیدایش و طبقه بندی خاکها
مستانه رحیمی مشکله؛ محمد امیر دلاور؛ محمد جمشیدی
چکیده
طبقه بندی داده های نامتعادل به یک موضوع تحقیقاتی مهم در زمینه داده کاوی تبدیل شده است. هدف از انجام این پژوهش شناسایی صحیح نمونه های کلاس اقلیت و افزایش دقت طبقه بندی کلاس های خاک با استفاده از رویکرد مدل تجمعی در بخشی از اراضی جنوب غربی استان زنجان است. تعداد 148 خاکرخ با روش الگوی شبکهبندی منظم و میانگین فاصله 500 متر حفر، تشریح و با ...
بیشتر
طبقه بندی داده های نامتعادل به یک موضوع تحقیقاتی مهم در زمینه داده کاوی تبدیل شده است. هدف از انجام این پژوهش شناسایی صحیح نمونه های کلاس اقلیت و افزایش دقت طبقه بندی کلاس های خاک با استفاده از رویکرد مدل تجمعی در بخشی از اراضی جنوب غربی استان زنجان است. تعداد 148 خاکرخ با روش الگوی شبکهبندی منظم و میانگین فاصله 500 متر حفر، تشریح و با تجزیه و تحلیل آزمایشگاهی تا سطح فامیل رده بندی گردید. مناسب ترین متغیرهای محیطی بر اساس نظر کارشناسی و رویکرد تحلیل مؤلفه اصلی از میان 57 متغیر شامل اطلاعات نقشه های ژئومورفولوژی و زمین شناسی، مدل رقومی ارتفاع و داده های حاصل از تصاویر ماهوارهای لندست 8 برای پیش بینی کلاس های خاک انتخاب شد. مدلسازی رابطه خاک - زمین نما با استفاده از الگوریتم های یادگیرنده جنگل تصادفی، درخت تصمیم توسعهیافته و رگرسیون لجستیک چندجمله ای و مدل تجمعی (بعد از متعادل سازی داده ها) در محیط نرمافزار "Rstudio" انجام شد. صحت کلی و ضریب کاپا برای ارزیابی کلاس های خاک در سطح زیرگروه به ترتیب در مدل های فردی رگرسیون لجستیک چندجمله ای 65 درصد و 0/41، جنگل تصادفی 65 درصد و 0/32، درخت تصمیم توسعهیافته 60 درصد و 0/35 و در مدل تجمعی 70 درصد و 0/62 به دست آمد. نتایج صحت کاربر و صحت تولیدکننده نشان داد در میان مدل های فردی، مدل رگرسیون لجستیک چندجمله ای دقت بالاتری در پیش بینی کلاس های خاک دارد.